NotionQAの解答速度改善を試してみた #Notion
NotionQAで色々試すアドベントカレンダー21日目です。
このアドベントカレンダーを書き始めてから、頻繁にNotionQAを使うようになりました。カレンダー用検証データのストック量が増えてくると、次第に引用されるページのパターンも見えてきます。
問題は記事本数と資料数増加に比例して質問を変えた回数が増えたことです。引用先候補の増加に伴って最適解が得難くなっています。
どのように処置することで最適解を効率的に得られるか、実際にNotionQAで試して効果があった手段を幾つか挙げてみます。
いらないデータやページは消す
本当に大事です。放置されたダミーデータが偶に引用で引っ張られて参照され続けることもあります。
出来ることは、ダミーのページ内容を取り替えるか、完全削除の2択です。実行後暫く時間を置いてQAすると、引用が完全に差し替わることもよくありました。
データベースを取りやめる
レコードにページ本文が一切なく且つプロパティがテキストのみの扱いで問題なければ、テーブルに変換してみましょう。
かなり効果があります。プロパティの断片引用がなくなることは勿論ながら、無関係なレコードが多数引用されていた場合は引用一覧から一切消滅し、変換後のテーブルを含む1ページが引用されるか、代わりに他のページが引用対象に含まれたりします。
なお、レコード総数が多量の場合は変換を受け付けてくれないようです。その場合は画一のデータベースとして扱わず、構成を分割するなど見直しをしましょう。確認した限りでは、SpreadSheet上で4桁行に到達している状況でコピペすると、テーブルとしての貼付けがエラーになり、データベースとしての取り込みを推奨されます。
ページ名を関連付ける
QAは本文やプロパティが完全マッチしたページを含むデータベース内であれば、部分的にマッチしたページも引用対象に含めているようです。部分的なマッチの度合いですが、以下図の様にタイトルに数文字程度も範疇のようです。これは本文がなくてもタイトルだけで引っ張ることを確認済みです。
関連のある内容のページであれば、ネーミングルールを決めてページ名を関連付けるだけで、質問次第でQA精度が上がる可能性はあります。
レコード本文にプロパティ情報を起す
データベースのプロパティから情報を引っ張ってくれることは確認済みですが、本文にもあったほうが引用率が高くなることを経験済みです。
とはいえ、プロパティと本文で2回書くのもなかなかの手間です。そんな時はAIに「プロパティの内容についてリスト形式で書き出して」と指示します。AIがプロパティを元にして的確にリスト化してくれます。
あとがき
適当に蓄積していると、後々でデータの取扱で頭を抱えることになります。ある程度溜まってきた時点で、ページ命名規則や本文のフォーマット、プロパティとして記録すべき要素の洗い出し等を行っておくとQAの精度向上にも繋がる可能性があります。